“Binning”!华大基因宏基因组高级分析“利器出鞘”
宏基因组测序
Metagenomic Sequencing
做测序免费的Meta,
选新鲜出炉的Binning,
发技惊四座的Paper!
什么是宏基因组Binning?
宏基因组分箱(Binning)是将宏基因组测序得到的混合了不同微生物的序列按物种聚类的过程。简言之,这是一个分类整理的过程,将混杂的序列信息装进不同的收纳盒里。分类精确到什么程度呢?接近于实际的个体菌株基因组。
自宏基因组Binning首次从牛瘤胃的样本中精确找出了15个不能培养的微生物的全基因组序列并成功登录Science以来,宏基因组Binning已经成为了CNS的常客,几乎是所有宏基因组高分论文的座上宾。
宏基因组Binning有什么用?
宏基因组Binning应用广泛,其中最有特色的两类是单菌组装和关联分析。
单菌组装:通过对Binning得到的Bins进行后续组装,可以得到很多不能在实验室里培养的细菌、古菌、病毒的基因组草图,然后根据单菌组装结果进行菌株水平的基因和功能注释、比较基因组分析、进化分析等,使我们得以洞察这些无法在实验室培养获得的菌株的生态适应机制,营养互作机制和新陈代谢功能等,可以研究在生态环境和复杂疾病中起重要作用的菌种以及致病菌和宿主的互作机制及其微进化机制。
关联分析:宏基因组关联分析、多组学联合分析,将特定功能代谢产物与特定物种、特定基因进行关联研究,推动其因果机制的探究,为疾病监控、环境监测提供了菌株水平的生物靶标。
华大基因的宏基因组Binning是怎么做的?
从数据质控到宏基因组de novo组装,再到丰富专业的Bin分析,华大基因宏基因组Binning提供优质的全流程服务。
图1 宏基因组Binning分析流程图
华大基因宏基因组Binning包含哪些主要内容?
Bins丰度圈图:直观展示了相应的Bins在各个组别的分布情况。
图2 Bins丰度圈图
可视化进化树: GTDB-Tk其中的classify_wf(Classify workflow,即分类工作流程)可以进行物种注释及进化分析。该流程主要包括了identify鉴定单拷贝标记基因、align多序列对齐和classify物种分类鉴定三步。进化树可利用R包的ggtree展示。
图3 Bin在门水平的可视化进化树
Bin基因组圈图:利用每个Bin(基于contigs)的Prokka蛋白预测信息,功能区注释信息(含正负链、CDS、RNA类型等信息),COG数据库注释结果,以及GC content、GC skew的统计结果绘制Circos圈图,可以直观展示每个Bin的功能注释信息。
图4 Bin基因组圈图
促销活动
倒计时
欲知更多详情,
请联系华大科技当地销售代表
热线电话:400-706-6615
邮箱:info@genomics.cn
+
华大基因相关服务
华大基因在微生物研究方面处于领先地位,拥有丰富的宏基因组项目经验,共400多篇微生物文章见刊;影响因子总和达2,500+;Nature/Science/Cell等顶尖杂志50余篇。华大基因可提供宏基因组测序、16S/18S/ITS测序、代谢组学及宏基因组+代谢组关联分析等服务,同时能够提供切实可行的项目方案,兼顾商业合作、科研合作优势。
宏基因组测序↓↓↓
测序准确性高:DNBSEQ™平台滚环扩增构建DNB测序文库,PCR扩增错误不会累积,高保真序列信息;
Duplication率低:DNBSEQ™平台Duplication率低,同样的数据量有效数据多出3%-17%;
无Index hopping担忧:DNBSEQ™平台无Index hopping担忧,结果更可靠;
经验丰富:已测序样本10,000+,涉及样本类型20多种;对于样本难获取的样本,可提供微量建库,样本量可低至几ng。
参考文献:
1. Metagenomic discovery of biomass-degrading genes and genomes from cow rumen. Hess, M., Sczyrba, A., Egan, R., Kim, T. W., Chokhawala, H., Schroth, G., Luo, S., Clark, D. S., Chen, F., Zhang, T., Mackie, R. I., Pennacchio, L. A., Tringe, S. G., Visel, A., Woyke, T., Wang, Z., & Rubin, E. M. (2011). Science (New York, N.Y.), 331(6016), 463-467.
2. Salmon provides fast and bias-aware quantification of transcript expression. Patro, R., Duggal, G., Love, M. I., Irizarry, R. A., & Kingsford, C. (2017). Nature methods, 14(4), 417-419.
3. GTDB-Tk: a toolkit to classify genomes with the Genome Taxonomy Database. Chaumeil, P. A., Mussig, A. J., Hugenholtz, P., & Parks, D. H. (2019). Bioinformatics (Oxford, England), 36(6), 1925-1927. Advance online publication.
4. Circos: an information aesthetic for comparative genomics
Krzywinski, M., Schein, J., Birol, I., Connors, J., Gascoyne, R., Horsman, D., Jones, S. J., & Marra, M. A. (2009). Genome research, 19(9), 1639-1645.
往期推荐
了解更多产品服务及资讯,关注我们!
点击“阅读原文”查看华大科技官网